library(tidyverse)
library(sf)
library(terra)
library(openxlsx)
library(mapview)
library(RColorBrewer)
library(osrm)
library(movecost)
library(fs)
library(stringr)
library(synthdid)
mapview::mapviewOptions(fgb=FALSE)
load("data/china.RData")
ntl1992<-terra::rast(x="data/9828827/Harmonized_DN_NTL_1992_calDMSP.tif")
ntl2018<-terra::rast(x="data/9828827/Harmonized_DN_NTL_2018_simVIIRS.tif")
ntl1992 <- ntl1992 %>%
terra::crop(y=ext(c(123.1,146.9,24.0,45.7)))
ntl2018 <- ntl2018 %>%
terra::crop(y=ext(c(123.1,146.9,24.0,45.7)))1992年日本
terra::plot(ntl1992)
2018年光り輝く日本 若干赤くなってる?
terra::plot(ntl2018)
因果推論アプローチの一つであるPotential outcome frameworkにおいて重要なのは 観察しえない反実仮想\(Y_{itD=0}\)をいかにして導き出すかという問題です。
反実仮想というのは例えば、統一した東ドイツ(に当たる地域の)経済\(Y_{itD=1}\)に対する統一しなかった場合の東ドイツ経済\(Y_{itD=0}\)や
拓銀が倒産した後の北海道経済(観察可能)に対する拓銀が生存した場合の北海道経済(観察不可能)などです。
今回紹介するSDID法は、本当に簡単に言うと
拓銀が倒産しなかった世界線の北海道を、他のいろんな県を組み合わせて作っちゃおう!
という発想が元になっています。
SDID法は差分の差分法(DID法)と合成コントロール法(SC)を組み合わせた手法である。
DID推定量は以下の通りであり \[ (\hat{\tau}^{DID}, \hat{\mu}, \hat{\alpha}, \hat{\beta})=argmin_{\mu,\alpha,\beta,\tau} \sum_{i=1}^N \sum_{t=1}^T(Y_{it}-\mu-\alpha_i-\beta_t-D_{it}\tau)^2 \] 各ユニット・時間において二乗誤差を最小にするような上記モデルは定数\(\mu\)、時間効果\(\beta\)、個人効果\(\alpha\)の線形結合で表される。ここで、因果効果をとらえるのは処置変数\(W_{it}\)の係数\(\hat{\tau}^{DID}\)である。
一方、合成コントロール法はSynthetic Control Methods for Comparative Case Studies(Abadie et al. 2010) で提案された。
アイデアとしては、処置を受ける前まで処置群を統制群(処置を受けない群)の重み付け(加重平均)で近似できるような \(\omega\) を求め、
\[ (\hat{\tau}^{SDID}, \hat{\mu}, \hat{\alpha}, \hat{\beta})=argmin_{\mu,\alpha,\beta,\tau} (\sum_{i=1}^N \sum_{t=1}^T(Y_{it}-\mu-\alpha_i-\beta_t-D_{it}\tau)^2 \hat{\omega}^{SDID}_i \hat{\lambda}^{SDID}_t) \]
jpn1<-sf::read_sf(dsn="data/JPN_shp/gadm41_JPN_2.shp")
mapview::mapview(x=jpn1)